Análisis Exploratorio de Datos¶
Calidad del agua del Rio Cauca¶
Descripción:
Contiene información de calidad de agua en el Rio Cauca, en 19 estaciones de muestreo.
Se miden aproximadamente 50 parámetros de calidad en el agua, entre Fisicoquímicos, Microbiológicos y Biológicos.
Contiene datos desde el año 1990.
Última Actualización
15 de julio de 2024
Datos suministrados por
Corporación Autónoma Regional del Valle del Cauca
Fuente:
Calidad del agua del Río Cauca
Información de los Datos:¶
Tamaño de muestra: 2254 datos
Número de Variables: 56
NOTA: Originalmente los datos vienen con un total de 56 variables pero para este análisis usaré las 23 variables más representativas.
Diccionario de Datos: (Las 23 con que se trabajará en el presente análisis)¶
| Nombre de la Variable | Descripción | Tipo de Variable | Escala de Medición | Unidades de Medición | |
|---|---|---|---|---|---|
| 1 | FECHA DE MUESTREO | Fecha en la que se tomó la muestra de agua. | Cualitativa | Nominal | Fecha |
| 2 | ESTACIONES | Lugar donde se tomó la muestra. | Cualitativa | Nominal | Nombre de la estación |
| 3 | pH | Nivel de acidez o alcalinidad del agua. | Cuantitativa | Intervalar | - |
| 4 | TEMPERATURA (°C) | Temperatura del agua en el momento del muestreo. | Cuantitativa | Razón | °C |
| 5 | COLOR (UPC) | Medida de la coloración del agua en unidades de platino-cobalto. | Cuantitativa | Razón | UPC |
| 6 | OXIGENO DISUELTO (mg O2/l) | Cantidad de oxígeno presente en el agua. | Cuantitativa | Razón | mg O₂/l |
| 7 | DEMANDA BIOQUIMICA DE OXIGENO (mg O2/l) | Cantidad de oxígeno consumido por microorganismos. | Cuantitativa | Razón | mg O₂/l |
| 8 | DEMANDA QUIMICA DE OXIGENO (mg O2/l) | Cantidad de oxígeno requerido para oxidar la materia orgánica. | Cuantitativa | Razón | mg O₂/l |
| 9 | TURBIEDAD (UNT) | Medición de la pérdida de transparencia del agua. | Cuantitativa | Razón | UNT |
| 10 | CONDUCTIVIDAD ELÉCTRICA (µS/cm) | Capacidad del agua para conducir electricidad. | Cuantitativa | Razón | µS/cm |
| 11 | SOLIDOS DISUELTOS (mg SD/l) | Cantidad de materia disuelta en el agua. | Cuantitativa | Razón | mg/l |
| 12 | NITRATOS (mg N-NO3/l) | Concentración de nitratos en el agua. | Cuantitativa | Razón | mg N-NO₃/l |
| 13 | FOSFATOS (mg PO4/l) | Concentración de fosfatos en el agua. | Cuantitativa | Razón | mg PO₄/l |
| 14 | CLORUROS (mg Cl/l) | Concentración de cloruros en el agua. | Cuantitativa | Razón | mg Cl/l |
| 15 | SULFATOS (mg SO4/l) | Concentración de sulfatos en el agua. | Cuantitativa | Razón | mg SO₄/l |
| 16 | PLOMO TOTAL (mg Pb/l) | Cantidad de plomo presente en el agua. | Cuantitativa | Razón | mg Pb/l |
| 17 | MERCURIO (µg Hg/l) | Cantidad de mercurio presente en el agua. | Cuantitativa | Razón | µg Hg/l |
| 18 | CROMO TOTAL (mg Cr/l) | Cantidad de cromo presente en el agua. | Cuantitativa | Razón | mg Cr/l |
| 19 | CADMIO TOTAL (mg Cd/l) | Cantidad de cadmio presente en el agua. | Cuantitativa | Razón | mg Cd/l |
| 20 | HIERRO TOTAL (mg Fe/l) | Cantidad de hierro presente en el agua. | Cuantitativa | Razón | mg Fe/l |
| 21 | COLIFORMES TOTALES (NMP/100 ml) | Cantidad de bacterias coliformes totales. | Cuantitativa | Razón | NMP/100 ml |
| 22 | COLIFORMES FECALES (NMP/100 ml) | Cantidad de bacterias coliformes fecales. | Cuantitativa | Razón | NMP/100 ml |
| 23 | CAUDAL (m3/s) | Volumen de agua que pasa por un punto del río en un segundo. | Cuantitativa | Razón | m³/s |
Vistazo rápido de algunos de los datos:¶
| FECHA DE MUESTREO | ESTACIONES | pH | TEMPERATURA (°C) | COLOR (UPC) | OXIGENO DISUELTO (mg O2/l) | DEMANDA BIOQUIMICA DE OXIGENO (mg O2/l) | DEMANDA QUIMICA DE OXIGENO (mg O2/l) | TURBIEDAD (UNT) | CONDUCTIVIDAD ELÉCTRICA (µS/cm) | ... | CLORUROS (mg Cl/l) | SULFATOS (mg SO4/l) | PLOMO TOTAL (mg Pb/l) | MERCURIO (µg Hg/l) | CROMO TOTAL (mg Cr/l) | CADMIO TOTAL (mg Cd/l) | HIERRO TOTAL (mg Fe/l) | COLIFORMES TOTALES (NMP/100 ml) | COLIFORMES FECALES (NMP/100 ml) | CAUDAL (m3/s) | |
|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
| 2099 | 09/22/2020 12:00:00 AM | LA VICTORIA | 7.25 | 25.1 | 401 | 2.68 | 4.38 | 28.5 | 95 | 135 | ... | 6.48 | 15.2 | <0,0499 | NaN | <0,108 | <0,0299 | 8.86 | 9.30E+03 | 9.30E+03 | NaN |
| 721 | 08/18/1999 12:00:00 AM | PUERTO ISAACS | 7.3 | 22 | 80 | 3.9 | 4.4 | 15.1 | 24 | 139 | ... | 4.4 | 17.04 | < 0.060 | NaN | < 0.200 | < 0.040 | 2.99 | >2.40E+08 | 9.55E+07 | NaN |
| 2081 | 03/18/2020 12:00:00 AM | ANACARO | 7.06 | 23 | 300 | 2.29 | 3.84 | 27.5 | 105 | 136 | ... | 5.82 | 15.5 | <0,0499 | NaN | <0,108 | <0,0299 | 2.92 | 2.40E+04 | 9.30E+03 | NaN |
| 543 | 05/12/1996 12:00:00 AM | LA VICTORIA | 7.4 | 23 | 90 | 2.6 | 3.6 | 51.2 | 97 | 163.2 | ... | 4.612 | 14.982 | <0.01 | NaN | <0.003 | <0.001 | 6.45 | 2.40E+05 | 2.40E+04 | * |
| 1259 | 04/16/2008 12:00:00 AM | PUENTE HORMIGUERO | 7.1 | 21.3 | 165 | 6.4 | 2.2 | 33.1 | 281 | 80.5 | ... | <2,33 | 15.8 | <0,06 | NaN | <0,2 | <0,04 | 9.73 | 1.10E+05 | 6.60E+04 | NaN |
| 112 | 08/22/1991 12:00:00 AM | PASO DE LA BALSA | 6.6 | NaN | NaN | 6.6 | 4.6 | 15.2 | 8 | 93.2 | ... | 6.91 | NaN | 0.69 | NaN | 0.007 | 0.031 | 13.08 | 2.40E+04 | 2.40E+03 | NaN |
| 1122 | 06/22/2006 12:00:00 AM | ANTES RIO TIMBA | 7.54 | 21.8 | 32.6 | 7.38 | 1.45 | <5,33 | 35 | 73.1 | ... | 2.43 | 10.23 | <0,06 | NaN | <0,2 | <0,04 | 1.18 | 1.50E+02 | 4.30E+01 | NaN |
| 525 | 09/04/1996 12:00:00 AM | PUENTE LA VIRGINIA | 6.6 | 23 | 175 | 3.2 | 9.9 | 20.2 | 186 | 189.9 | ... | 6.712 | 26.908 | <0.01 | NaN | <0.003 | <0.001 | 17.98 | 2.40E+06 | 2.40E+06 | NaN |
| 1266 | 04/16/2008 12:00:00 AM | YOTOCO | 7.05 | 23.1 | 264 | 3.42 | 2.48 | 22.73 | 374 | 129.2 | ... | <2,33 | 12.26 | <0,06 | NaN | <0,2 | <0,04 | 15.7 | 1.10E+06 | 6.60E+05 | NaN |
| 1276 | 07/02/2008 12:00:00 AM | PASO DE LA BALSA | 7.2 | 21 | 53.2 | 6.43 | <1,937 | 5.95 | 57 | 60.5 | ... | 4.13 | 12.56 | <0,06 | NaN | <0,2 | NaN | 2.24 | 9.30E+03 | 9.30E+03 | NaN |
10 rows × 23 columns
Información de los datos.¶
Se observa que a excepción de la variable 'MERCURIO (µg Hg/l)',
todas las variables son de tipo object, por lo que procederé a cambiarlas
según sea pertinente.
<class 'pandas.core.frame.DataFrame'> RangeIndex: 2254 entries, 0 to 2253 Data columns (total 23 columns): # Column Non-Null Count Dtype --- ------ -------------- ----- 0 FECHA DE MUESTREO 2254 non-null object 1 ESTACIONES 2254 non-null object 2 pH 2208 non-null object 3 TEMPERATURA (°C) 1967 non-null object 4 COLOR (UPC) 1888 non-null object 5 OXIGENO DISUELTO (mg O2/l) 2224 non-null object 6 DEMANDA BIOQUIMICA DE OXIGENO (mg O2/l) 2231 non-null object 7 DEMANDA QUIMICA DE OXIGENO (mg O2/l) 2229 non-null object 8 TURBIEDAD (UNT) 2099 non-null object 9 CONDUCTIVIDAD ELÉCTRICA (µS/cm) 2197 non-null object 10 SOLIDOS DISUELTOS (mg SD/l) 2191 non-null object 11 NITRATOS (mg N-NO3/l) 2194 non-null object 12 FOSFATOS (mg PO4/l) 2123 non-null object 13 CLORUROS (mg Cl/l) 2172 non-null object 14 SULFATOS (mg SO4/l) 1962 non-null object 15 PLOMO TOTAL (mg Pb/l) 1928 non-null object 16 MERCURIO (µg Hg/l) 0 non-null float64 17 CROMO TOTAL (mg Cr/l) 2030 non-null object 18 CADMIO TOTAL (mg Cd/l) 1892 non-null object 19 HIERRO TOTAL (mg Fe/l) 2107 non-null object 20 COLIFORMES TOTALES (NMP/100 ml) 2035 non-null object 21 COLIFORMES FECALES (NMP/100 ml) 2063 non-null object 22 CAUDAL (m3/s) 228 non-null object dtypes: float64(1), object(22) memory usage: 405.1+ KB
Calidad de los datos:¶
Cambio de tipo de datos:¶
Cambio de la variable "FECHA DE MUESTREO" de tipo object a tipo DateTime:
| FECHA DE MUESTREO | ESTACIONES | pH | TEMPERATURA (°C) | COLOR (UPC) | OXIGENO DISUELTO (mg O2/l) | DEMANDA BIOQUIMICA DE OXIGENO (mg O2/l) | DEMANDA QUIMICA DE OXIGENO (mg O2/l) | TURBIEDAD (UNT) | CONDUCTIVIDAD ELÉCTRICA (µS/cm) | ... | CLORUROS (mg Cl/l) | SULFATOS (mg SO4/l) | PLOMO TOTAL (mg Pb/l) | MERCURIO (µg Hg/l) | CROMO TOTAL (mg Cr/l) | CADMIO TOTAL (mg Cd/l) | HIERRO TOTAL (mg Fe/l) | COLIFORMES TOTALES (NMP/100 ml) | COLIFORMES FECALES (NMP/100 ml) | CAUDAL (m3/s) | |
|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
| 393 | 1995-08-19 | LA VICTORIA | 7.6 | 22 | 50 | 3.1 | 5.1 | 27 | 20 | 188.6 | ... | 9 | 21.21 | <0,01 | NaN | <0,003 | <0,001 | 6.1 | 2.40E+04 | 2.40E+03 | 158 |
| 359 | 1994-10-10 | PASO DE LA BOLSA | 7.2 | 15 | 400 | 4.7 | 2.7 | 35.6 | 150 | 85.3 | ... | 3 | 33.314 | <0.01 | NaN | <0.003 | <0.001 | 2.06 | 2.4*10E4 | 2.4*10E4 | NaN |
| 1602 | 2012-11-20 | PASO DE LA TORRE | 6.54 | 24.7 | 97 | 0.899 | 5.89 | 22 | 101 | 156 | ... | 7.05 | <5,00 | * | NaN | * | * | 8.13 | 1.10E+07 | 1.50E+06 | NaN |
3 rows × 23 columns
Cambio de la variable "ESTACIONES" de tipo object a tipo category:
| FECHA DE MUESTREO | ESTACIONES | pH | TEMPERATURA (°C) | COLOR (UPC) | OXIGENO DISUELTO (mg O2/l) | DEMANDA BIOQUIMICA DE OXIGENO (mg O2/l) | DEMANDA QUIMICA DE OXIGENO (mg O2/l) | TURBIEDAD (UNT) | CONDUCTIVIDAD ELÉCTRICA (µS/cm) | ... | CLORUROS (mg Cl/l) | SULFATOS (mg SO4/l) | PLOMO TOTAL (mg Pb/l) | MERCURIO (µg Hg/l) | CROMO TOTAL (mg Cr/l) | CADMIO TOTAL (mg Cd/l) | HIERRO TOTAL (mg Fe/l) | COLIFORMES TOTALES (NMP/100 ml) | COLIFORMES FECALES (NMP/100 ml) | CAUDAL (m3/s) | |
|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
| 466 | 1995-09-15 | PUERTO ISAACS | 6.7 | 22 | 100 | 4.8 | 6.3 | 41 | 190 | 84.9 | ... | 3.1 | 8.14 | <0,01 | NaN | <0,003 | <0,001 | 11.5 | NaN | 2.40E+06 | NaN |
| 1941 | 2018-03-06 | PUENTE HORMIGUERO | 7.4 | 26 | 845 | 6.24 | 1.98 | 31.3 | 143 | 86.3 | ... | <0,112 | 11.5 | <0,100 | NaN | <0,100 | NaN | NaN | 2.00E+03 | 1.50E+03 | NaN |
| 413 | 1995-05-17 | LA VICTORIA | 7.8 | 22 | 75 | 2.2 | 4 | 4 | 72 | 166.4 | ... | 5 | 22.09 | <0,01 | NaN | <0,003 | <0,001 | 2.09 | 2.40E+04 | 2.40E+03 | 418 |
3 rows × 23 columns
Cambio de las variables númericas de tipo object a tipo float64:
<class 'pandas.core.frame.DataFrame'> RangeIndex: 2254 entries, 0 to 2253 Data columns (total 23 columns): # Column Non-Null Count Dtype --- ------ -------------- ----- 0 FECHA DE MUESTREO 2243 non-null datetime64[ns] 1 ESTACIONES 2254 non-null category 2 pH 2151 non-null float64 3 TEMPERATURA (°C) 1905 non-null float64 4 COLOR (UPC) 1849 non-null float64 5 OXIGENO DISUELTO (mg O2/l) 2125 non-null float64 6 DEMANDA BIOQUIMICA DE OXIGENO (mg O2/l) 2036 non-null float64 7 DEMANDA QUIMICA DE OXIGENO (mg O2/l) 2019 non-null float64 8 TURBIEDAD (UNT) 2088 non-null float64 9 CONDUCTIVIDAD ELÉCTRICA (µS/cm) 2162 non-null float64 10 SOLIDOS DISUELTOS (mg SD/l) 2188 non-null float64 11 NITRATOS (mg N-NO3/l) 1906 non-null float64 12 FOSFATOS (mg PO4/l) 1104 non-null float64 13 CLORUROS (mg Cl/l) 2026 non-null float64 14 SULFATOS (mg SO4/l) 1881 non-null float64 15 PLOMO TOTAL (mg Pb/l) 172 non-null float64 16 MERCURIO (µg Hg/l) 0 non-null float64 17 CROMO TOTAL (mg Cr/l) 195 non-null float64 18 CADMIO TOTAL (mg Cd/l) 100 non-null float64 19 HIERRO TOTAL (mg Fe/l) 1991 non-null float64 20 COLIFORMES TOTALES (NMP/100 ml) 1814 non-null float64 21 COLIFORMES FECALES (NMP/100 ml) 1870 non-null float64 22 CAUDAL (m3/s) 222 non-null float64 dtypes: category(1), datetime64[ns](1), float64(21) memory usage: 390.5 KB
Nota:¶
Luego de cambiar el tipo de datos de la variable "FECHA DE MUESTREO" de object a datetime, el número
de valores no nulos disminuyó de 2254 a 2243, lo que sugiere la presencia datos erróneos en la variable,
que fueron convertidos a valores nulos (NaT).
Porcentaje de Datos faltantes por variable:¶
Vemos que no existen datos para la variable "MERCURIO (µg Hg/l)" por lo que procederé a eliminarla.
Las demás variables aunque tengan datos faltantes (algunas más del 80% de datos faltantes) voy a mantenerlas.
Para un mejor análisis sería pertinente preguntar si los datos faltantes equivalen a mediciones cuyo resultado fué 0
o si simplemente no se realizaron dichas mediciones.
Para el presente análisis, asumiré que los datos faltantes son datos cuya medición no fué realizada.
Valores Nulos en la variable "FECHA DE MUESTREO"¶
| FECHA DE MUESTREO | ESTACIONES | pH | TEMPERATURA (°C) | COLOR (UPC) | OXIGENO DISUELTO (mg O2/l) | DEMANDA BIOQUIMICA DE OXIGENO (mg O2/l) | DEMANDA QUIMICA DE OXIGENO (mg O2/l) | TURBIEDAD (UNT) | CONDUCTIVIDAD ELÉCTRICA (µS/cm) | ... | CLORUROS (mg Cl/l) | SULFATOS (mg SO4/l) | PLOMO TOTAL (mg Pb/l) | MERCURIO (µg Hg/l) | CROMO TOTAL (mg Cr/l) | CADMIO TOTAL (mg Cd/l) | HIERRO TOTAL (mg Fe/l) | COLIFORMES TOTALES (NMP/100 ml) | COLIFORMES FECALES (NMP/100 ml) | CAUDAL (m3/s) | |
|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
| 63 | 05/12/1290 12:00:00 AM | RIOFRIO | 6.6 | NaN | NaN | 3.2 | 2.6 | 156 | 350 | 150 | ... | 16 | NaN | NaN | NaN | NaN | NaN | 12.95 | 2.4*10E6 | 2.4*10E6 | NaN |
| 66 | 05/12/1290 12:00:00 AM | MEDIACANOA | 6.6 | NaN | NaN | 2.8 | 3.5 | 60 | 400 | 130 | ... | 9 | NaN | NaN | NaN | NaN | NaN | 3.52 | 2.4*10E6 | 2.4*10E6 | NaN |
| 282 | 10/12/1193 12:00:00 AM | ANTES RIO OVEJAS | 6.3 | 14 | 50 | 4.4 | 0.6 | 6.4 | 17 | 104.6 | ... | 6.56 | 32.8 | <0.01 | NaN | <0.003 | <0.001 | 1.01 | 2.40E+03 | 2.40E+03 | NaN |
| 284 | 10/12/1193 12:00:00 AM | PASO DE LA BALSA | 6.9 | 15 | 100 | 7.3 | 0.9 | 67.7 | 91 | 72 | ... | 5.25 | 34.2 | <0.01 | NaN | <0.003 | <0.001 | 2.88 | 2.40E+05 | 2.40E+05 | 103 |
| 285 | 11/12/1193 12:00:00 AM | PASO DE LA BOLSA | 6.06 | 20.4 | 300 | 6.2 | 2.7 | 43.8 | 160 | 62 | ... | 3.94 | 56.08 | <0.01 | NaN | <0.003 | <0.001 | 3.66 | 2.40E+08 | 2.40E+05 | 213 |
| 286 | 11/12/1193 12:00:00 AM | PUENTE HORMIGUERO | 7 | 23 | 100 | 5.9 | 2.3 | 47.8 | 120 | 87 | ... | 5.25 | 37.62 | <0.01 | NaN | <0.003 | <0.0010 | 2.48 | 2.40E+07 | 2.40E+06 | 274 |
| 331 | 06/12/1194 12:00:00 AM | RIOFRIO | 7 | 16 | 22.5 | 2.4 | 5.6 | 39.4 | 44 | 163.2 | ... | 7.1 | 24.38 | <0.01 | NaN | <0.003 | <0.001 | 1.25 | 2.4*10E5 | 2.4*10E5 | NaN |
| 332 | 06/12/1194 12:00:00 AM | PUENTE GUAYABAL | 7 | 16 | 20 | 2.4 | 3.8 | 19.7 | 35 | 173.4 | ... | 6.7 | 23.25 | <0.01 | NaN | <0.003 | <0.001 | 2.93 | 2.4*10E5 | 2.4*10E5 | NaN |
| 333 | 06/12/1194 12:00:00 AM | LA VICTORIA | 7.5 | 16 | 22.5 | 3.2 | 2.3 | 23.6 | 47 | 173.4 | ... | 7.2 | 25.51 | <0.01 | NaN | <0.003 | <0.001 | 3.97 | 2.4*10E5 | 2.4*10E4 | NaN |
| 334 | 06/12/1194 12:00:00 AM | ANACARO | 7.9 | 16 | 22.5 | 2.9 | 1.9 | 74.8 | 36 | 173.4 | ... | 7.3 | 26.64 | <0.01 | NaN | <0.003 | <0.001 | 2.52 | 2.4*10E5 | 2.4*10E5 | NaN |
| 335 | 06/12/1194 12:00:00 AM | PUENTE LA VIRGINIA | 7.6 | 16 | 27.5 | 3.6 | 1.9 | 55.1 | 45 | 163.2 | ... | 7.2 | 24.38 | <0.01 | NaN | <0.003 | <0.001 | 1.49 | 2.4*10E4 | 2.4*10E3 | NaN |
11 rows × 23 columns
El error en las fechas se debe a valores registrados entre los años 1193 y 1290, lo que sugiere un posible error de tipeo. Es probable que estas fechas debieran corresponder a 1990-1993. No obstante, utilizaré estos datos únicamente para analizar la presencia de valores atípicos en otras variables. Para el resto del análisis, serán descartados.
Errores de digitación para la variable "ESTACIONES"¶
Como lo dice la descripción de los datos, son en total 19 estaciones de muestreo
por lo que se espera que en dicha variable sólo hayan 19 datos únicos.
0 YOTOCO 1 MEDIACANOA 2 PASO DE LA TORRE 3 ANTES SUAREZ 4 ANTES RIO OVEJAS 5 ANTES RIO TIMBA 6 PASO DE LA BALSA 7 PASO DE LA BOLSA 8 PUENTE HORMIGUERO 9 ANTES INTERCEPTOR SUR 10 JUANCHITO 11 PASO DEL COMERCIO 12 PUERTO ISAACS 13 VIJES 14 RIOFRIO 15 PUENTE GUAYABAL 16 LA VICTORIA 17 ANACARO 18 PUENTE LA VIRGINIA 19 PASO DE LA BALSA 20 PASO DE LA BOLSA 21 PUENTE HORMIGUERO 22 ANTES INTERCEPTOR 23 PASO DE LA TORRE dtype: category Categories (24, object): ['ANACARO', 'ANTES INTERCEPTOR', 'ANTES INTERCEPTOR SUR', 'ANTES RIO OVEJAS', ..., 'PUERTO ISAACS', 'RIOFRIO', 'VIJES', 'YOTOCO']
Se observa que hay un total de 24 datos únicos, por lo que procederé a realizar la limpieza de los datos.
0 YOTOCO 1 MEDIACANOA 2 PASO DE LA TORRE 3 ANTES SUAREZ 4 ANTES RIO OVEJAS 5 ANTES RIO TIMBA 6 PASO DE LA BALSA 7 PASO DE LA BOLSA 8 PUENTE HORMIGUERO 9 ANTES INTERCEPTOR SUR 10 JUANCHITO 11 PASO DEL COMERCIO 12 PUERTO ISAACS 13 VIJES 14 RIOFRIO 15 PUENTE GUAYABAL 16 LA VICTORIA 17 ANACARO 18 PUENTE LA VIRGINIA dtype: object
Estadísticas Descriptivas:¶
Fecha:¶
min 1990-01-10 max 2023-11-10 Name: FECHA DE MUESTREO, dtype: datetime64[ns]
Variables numéricas:¶
| pH | TEMPERATURA (°C) | COLOR (UPC) | OXIGENO DISUELTO (mg O2/l) | DEMANDA BIOQUIMICA DE OXIGENO (mg O2/l) | DEMANDA QUIMICA DE OXIGENO (mg O2/l) | TURBIEDAD (UNT) | CONDUCTIVIDAD ELÉCTRICA (µS/cm) | SOLIDOS DISUELTOS (mg SD/l) | NITRATOS (mg N-NO3/l) | FOSFATOS (mg PO4/l) | CLORUROS (mg Cl/l) | SULFATOS (mg SO4/l) | PLOMO TOTAL (mg Pb/l) | CROMO TOTAL (mg Cr/l) | CADMIO TOTAL (mg Cd/l) | HIERRO TOTAL (mg Fe/l) | COLIFORMES TOTALES (NMP/100 ml) | COLIFORMES FECALES (NMP/100 ml) | CAUDAL (m3/s) | |
|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
| count | 2151.000000 | 1905.000000 | 1849.000000 | 2125.000000 | 2036.000000 | 2019.000000 | 2088.000000 | 2162.000000 | 2188.000000 | 1.906000e+03 | 1104.000000 | 2026.000000 | 1881.000000 | 172.000000 | 195.000000 | 100.00000 | 1991.000000 | 1.814000e+03 | 1.870000e+03 | 2.220000e+02 |
| mean | 7.039240 | 21.985701 | 137.262125 | 4.092809 | 5.249136 | 29.755235 | 130.851624 | 125.183793 | 117.538071 | 1.182210e+05 | 0.103874 | 7.270358 | 18.671384 | 0.279458 | 0.119874 | 3.40100 | 8.124948 | 5.694182e+09 | 1.283456e+13 | 1.166691e+05 |
| std | 0.406411 | 3.633884 | 246.364937 | 2.988060 | 16.463874 | 37.510858 | 171.071341 | 107.923378 | 63.663964 | 3.630743e+06 | 0.628373 | 20.861612 | 17.824992 | 0.282435 | 0.163972 | 7.26224 | 15.897478 | 1.128802e+11 | 5.549967e+14 | 6.416359e+05 |
| min | 4.100000 | 0.000000 | 0.000000 | 0.000000 | 0.100000 | 1.460000 | 1.000000 | 0.000000 | 0.000000 | 0.000000e+00 | 0.000000 | 0.167000 | 0.000000 | 0.000000 | 0.000000 | 0.00000 | 0.005000 | 0.000000e+00 | 0.000000e+00 | 1.000000e+00 |
| 25% | 6.800000 | 20.900000 | 39.300000 | 2.330000 | 2.047500 | 14.000000 | 30.000000 | 88.125000 | 83.000000 | 1.840000e-01 | 0.035000 | 4.250000 | 14.000000 | 0.010000 | 0.011000 | 0.00100 | 1.760000 | 2.400000e+04 | 4.850000e+03 | 1.560000e+02 |
| 50% | 7.060000 | 22.400000 | 72.400000 | 3.810000 | 3.100000 | 20.600000 | 65.000000 | 118.000000 | 108.000000 | 3.685000e-01 | 0.070000 | 6.000000 | 17.500000 | 0.220000 | 0.057000 | 0.01700 | 3.620000 | 2.100000e+05 | 4.200000e+04 | 2.335000e+02 |
| 75% | 7.270000 | 24.100000 | 136.000000 | 5.670000 | 4.800000 | 31.580000 | 156.400000 | 151.000000 | 136.000000 | 6.765750e-01 | 0.103000 | 8.247500 | 21.562000 | 0.482500 | 0.143500 | 0.04400 | 8.790000 | 2.100000e+06 | 2.400000e+05 | 4.017500e+02 |
| max | 9.700000 | 32.700000 | 2956.000000 | 51.500000 | 427.000000 | 706.000000 | 1900.000000 | 4259.000000 | 864.400000 | 1.500000e+08 | 20.100000 | 738.000000 | 696.800000 | 1.540000 | 0.997000 | 24.40000 | 186.000000 | 2.400000e+12 | 2.400000e+16 | 6.600000e+06 |
Estaciones de muestreo:¶
| ESTACIÓN | CONTEO | PORCENTAJE | |
|---|---|---|---|
| 0 | JUANCHITO | 130 | 5.7675 |
| 1 | MEDIACANOA | 128 | 5.6788 |
| 2 | PASO DE LA TORRE | 127 | 5.6344 |
| 3 | PUERTO ISAACS | 126 | 5.5901 |
| 4 | VIJES | 125 | 5.5457 |
| 5 | PASO DEL COMERCIO | 124 | 5.5013 |
| 6 | PUENTE HORMIGUERO | 122 | 5.4126 |
| 7 | YOTOCO | 121 | 5.3682 |
| 8 | PASO DE LA BOLSA | 116 | 5.1464 |
| 9 | ANTES RIO TIMBA | 115 | 5.1020 |
| 10 | ANTES RIO OVEJAS | 115 | 5.1020 |
| 11 | PASO DE LA BALSA | 115 | 5.1020 |
| 12 | ANTES INTERCEPTOR SUR | 115 | 5.1020 |
| 13 | ANTES SUAREZ | 114 | 5.0577 |
| 14 | PUENTE GUAYABAL | 113 | 5.0133 |
| 15 | LA VICTORIA | 113 | 5.0133 |
| 16 | RIOFRIO | 112 | 4.9689 |
| 17 | ANACARO | 112 | 4.9689 |
| 18 | PUENTE LA VIRGINIA | 111 | 4.9246 |
Gráficos:¶
Tener en cuenta:
Para el análisis me apoyé de un documento técnico de la CVC sobre el tema:
Objetivos de calidad del río Cauca – Tramo Valle del Cauca: Documento técnico de soporte
Boxplots:¶
Mapa de Calor:¶
Se observa que las variables con correlaciones más fuertes son aquellas cuyo porcentaje de valores nulos es igual o superior al 90%
lo que sugiere que estas relaciones pueden estar sesgadas debido a la escasez de datos.
Oxigeno Disuelto:¶
"El oxígeno disuelto nos permite cuantificar la cantidad de oxigeno presente
en el medio acuoso el cual puede ser aprovechado por los diferentes
organismos, utilizado en los procesos de oxidación y demás consumos que
se requieran dependiendo de la carga contaminante que transporta el cuerpo
de agua, la Corporación identificó que el valor mínimo de oxígeno disuelto
que se debe garantizar en un cuerpo de agua para no afectar sus dinámicas
naturales ni generar alteraciones o afectaciones en los organismos que en él
habitan debe ser mayor o igual a 4 mg/l."
(CVC, 2023, p. 36).
Referencia:
Corporación Autónoma Regional del Valle del Cauca (CVC). (2023).
Objetivos de calidad del río Cauca – Tramo Valle del Cauca: Documento técnico de soporte (p. 36). Dirección Técnica Ambiental.
En el reporte de la CVC se puede identificar el orden en que están ubicadas algunas de las estaciones presentes en los datos. Esta información es útil para analizar cómo evoluciona la calidad del agua a medida que el río avanza por su cauce.
Figura 1. Estaciones de monitoreo de la calidad del agua sobre el río Cauca,
en jurisdicción de la CVC.
Tomado de Objetivos de calidad del río Cauca – Tramo Valle del Cauca (CVC, 2023, p. 33).
Orden de las estaciones identificadas:
1 ANTES RIO TIMBA
2 PASO DE LA BALSA
3 PASO DE LA BOLSA
4 PUENTE HORMIGUERO
5 [Estación no identificada]
6 JUANCHITO
7 PASO DEL COMERCIO
8 PUERTO ISAACS
9 PASO DE LA TORRE
10 VIJES
11 YOTOCO
12 MEDIACANOA
13 RIOFRIO
14 PUENTE GUAYABAL
15 LA VICTORIA
16 ANACARO
17 PUENTE LA VIRGINIA
En la gráfica del promedio de oxígeno disuelto a lo largo de los años (1990-2023) por estación, se observa una tendencia decreciente en sus niveles a medida que el río avanza por las estaciones de monitoreo. En la estación "Puerto Isaacs", el promedio de oxígeno disuelto cae por debajo del umbral crítico de 4 mg/L, y en "Yotoco" desciende aún más, llegando a menos de 2 mg/L. Aunque a partir de "Mediacanoa" los niveles comienzan a recuperarse, en el resto de las estaciones el oxígeno disuelto se mantiene por debajo de 4 mg O₂/L, lo que indica una condición preocupante para la calidad del agua y la vida acuática.
Nota:
Para un análisis más preciso debería identificarse la posición en la que se encuentran las estaciones "ANTES INTERCEPTOR SUR", "ANTES SUAREZ" y "ANTES RIO OVEJAS".